我们提出了一种无标记的性能捕获方法,该方法从稀疏采样的未跟踪3D点云的稀疏采样序列中计算随时间变形的参与者变形的时间相干4D表示。我们的方法通过以前的时空运动来进行潜在优化。最近,已经引入了任务通用运动先验,并提出了基于单个潜在代码的人类运动的连贯表示,并具有简短序列和给定时间对应关系的令人鼓舞的结果。将这些方法扩展到没有对应的较长序列几乎是直接的。一种潜在代码证明,由于可能的倒置姿势配件,因此对长期可变性的编码效率低下,而潜在空间优化将非常容易受到错误的本地最小值。我们通过学习一个运动来解决这两个问题,该动作将4D人体运动序列编码为一系列潜在的原语,而不是一个潜在的代码。我们还提出了一个附加的映射编码器,该编码器将点云直接投入到学习的潜在空间中,以在推理时提供潜在表示的良好初始化。我们从潜在空间进行的时间解码是隐式和连续的,可以通过时间分辨率提供灵活性。我们通过实验表明我们的方法优于最先进的运动先验。
translated by 谷歌翻译
我们提出了一个框架来学习一个结构化的潜在空间来代表4D人体运动,其中每个潜在向量都编码整个3D人类形状的全部运动。一方面,存在一些数据驱动的骨骼动画模型,提出了时间密集运动信号的运动空间,但基于几何稀疏的运动学表示。另一方面,存在许多方法来构建密集的3D几何形状的形状空间,但对于静态帧。我们将两个概念汇总在一起,提出一个运动空间,该运动空间在时间和几何上都很密集。经过训练后,我们的模型将基于低维潜在空间中的单个点生成多帧序列。该潜在空间是构建为结构化的,因此类似的运动形成簇。它还嵌入了潜在矢量中的持续时间变化,允许语义上的接近序列,这些序列仅因时间展开而不同以共享相似的潜在矢量。我们通过实验证明了潜在空间的结构特性,并表明它可用于在不同动作之间生成合理的插值。我们还将模型应用于4D人类运动的完成,显示其有希望学习人类运动时空特征的能力。
translated by 谷歌翻译
We introduce hp-greedy, a refinement approach for building gravitational wave surrogates as an extension of the standard reduced basis framework. Our proposal is data-driven, with a domain decomposition of the parameter space, local reduced basis, and a binary tree as the resulting structure, which are obtained in an automated way. When compared to the standard global reduced basis approach, the numerical simulations of our proposal show three salient features: i) representations of lower dimension with no loss of accuracy, ii) a significantly higher accuracy for a fixed maximum dimensionality of the basis, in some cases by orders of magnitude, and iii) results that depend on the reduced basis seed choice used by the refinement algorithm. We first illustrate the key parts of our approach with a toy model and then present a more realistic use case of gravitational waves emitted by the collision of two spinning, non-precessing black holes. We discuss performance aspects of hp-greedy, such as overfitting with respect to the depth of the tree structure, and other hyperparameter dependences. As two direct applications of the proposed hp-greedy refinement, we envision: i) a further acceleration of statistical inference, which might be complementary to focused reduced-order quadratures, and ii) the search of gravitational waves through clustering and nearest neighbors.
translated by 谷歌翻译
这项工作在拆分计算领域迈出了重大步骤,即如何拆分深神经网络以将其早期部分托管在嵌入式设备上,而其余则在服务器上。到目前为止,已经确定了潜在的分裂位置,以利用独特的建筑方面,即基于层尺寸。在此范式下,只有在执行分裂并重新训练整个管道后,才能评估分裂的疗效,从而对所有合理的分裂点在时间方面进行详尽的评估。在这里,我们表明,不仅层的结构确实很重要,而且其中包含的神经元的重要性也很重要。如果神经元相对于正确的班级决策,神经元很重要。因此,应在具有高密度的重要神经元的层后立即施加拆分,以保留流动的信息。根据这个想法,我们提出了可解释的拆分(i-split):通过提供有关该分型在分类准确性方面的表现,事先对其有效实现的可靠性,以确定最合适的分裂点的过程。作为I-Split的另一个重大贡献,我们表明,多类分类问题的分裂点的最佳选择还取决于网络必须处理的特定类别。详尽的实验已在两个网络(VGG16和Resnet-50)以及三个数据集(Tiny-Imagenet-200,Notmnist和胸部X射线肺炎)上进行。源代码可在https://github.com/vips4/i-split上获得。
translated by 谷歌翻译
传统的自动门不能区分希望穿过门和经过门的人们,因此他们经常不必要地打开。这导致需要在商业和非商业环境中采用新系统:智能门。特别是,智能门系统根据周围环境的社会环境预测了门附近的人们的意图,然后就是否打开门做出合理的决定。这项工作提出了与智能门有关的第一张纸张,没有铃铛和哨子。我们首先指出,问题不仅涉及可靠性,气候控制,安全性和操作方式。的确,通过对近亲学和场景推理的复杂结合分析,一种预测门附近人们意图的系统还涉及对场景的社会背景的更深入了解。此外,我们对自动门进行了详尽的文献综述,提供了一种新型的系统配方。此外,我们对智能门的未来应用,道德缺陷的描述和立法问题进行了分析。
translated by 谷歌翻译
软机器人操纵器对于在受限环境中的医疗干预或工业检查等一系列应用都具有吸引力。文献中已经提出了无数的软机器人操纵器,但是它们的设计往往相对相似,并且通常提供相对较低的力。这限制了他们可以携带的有效载荷,因此限制了它们的可用性。在公共框架下不可用不同设计的力的比较,并且设计具有不同的直径和功能,使它们难以比较。在本文中,我们介绍了一种软机器人操纵器的设计,该设计的优化为最大化其力,同时尊重典型的应用程序约束,例如大小,工作区,有效负载能力和最大压力。此处介绍的设计具有一个优势,即它变为最佳设计,因为它被加压到朝不同方向移动,这会导致较高的横向力。该机器人是使用一组原理设计的,因此可以适应其他应用程序。我们还为软机器人操纵器提供了非二维分析,并将其应用于此处提出的设计的性能与文献中其他设计的性能。我们表明,我们的设计比同一类别中的其他设计具有更高的力量。实验结果证实了我们提出的设计的较高力量。
translated by 谷歌翻译
FM合成是一种众所周知的算法,用于从紧凑的设计原始素中生成复杂的音色。通常具有MIDI接口,通常是不切实际的,从音频源进行控制。另一方面,可区分的数字信号处理(DDSP)已通过深度神经网络(DNN)启用了细微的音频渲染,这些音频渲染学会了从任意声音输入中控制可区分的合成层。训练过程涉及一系列音频进行监督和光谱重建损失功能。这样的功能虽然非常适合匹配光谱振幅,但却存在缺乏俯仰方向,这可能会阻碍FM合成器参数的关节优化。在本文中,我们采取了步骤,从音频输入中连续控制良好的FM合成体系结构。首先,我们讨论一组设计约束,通过标准重建损失来简化可区分的FM合成器的光谱优化。接下来,我们介绍可区分的DX7(DDX7),这是一种轻巧的体系结构,可根据一组紧凑的参数来进行乐器声音的神经FM重新合成。我们在从URMP数据集中提取的仪器样品上训练该模型,并定量证明其针对选定基准测试的音频质量可比。
translated by 谷歌翻译
在各种领域,包括搜索和救援,自动驾驶汽车导航和侦察的各个领域,形成不断变化的场景的非线图像(NLOS)图像的能力可能具有变革性。大多数现有的活性NLOS方法使用针对继电器表面并收集回返回光的时间分辨测量的脉冲激光来照亮隐藏场景。流行的方法包括对垂直壁上的矩形网格的栅格扫描,相对于感兴趣的数量,以产生共聚焦测量集合。这些固有地受到激光扫描的需求的限制。避免激光扫描的方法将隐藏场景的运动部件作为一个或两个点目标。在这项工作中,基于更完整的光学响应建模,但仍没有多个照明位置,我们演示了运动中对象的准确重建和背后的固定风景的“地图”。计数,本地化和表征运动中隐藏物体的大小,结合固定隐藏场景的映射的能力,可以大大提高各种应用中的室内情况意识。
translated by 谷歌翻译
有充分的神经生物学证据表明,上下文敏感的新皮质神经元使用其顶端输入来放大相干进料(FF)输入的传播。但是,到目前为止,尚未证明这种已知机制如何提供有用的神经计算。在这里,我们首次展示了这种神经信息处理的处理和学习能力与哺乳动物新皮层的能力相匹配。具体而言,我们表明,由此类本地处理器组成的网络将冲突的信息传输到更高级别,并大大减少处理大量异质现实世界数据所需的活动量,例如在处理视听语音时,这些本地处理器使用这些本地处理器时看到唇部动作可有选择地放大这些动作产生的听觉信息的FF传输,反之亦然。由于这种机制比最佳可用的深神经网的最佳形式更有效率,因此它为理解大脑的神秘能量节能机制提供了逐步改变,并激发了设计增强形式的生物学上的机器学习算法的进步。
translated by 谷歌翻译
精确和高保真力控制对于与人类和未知环境相互作用的新一代机器人至关重要。移动机器人(例如可穿戴设备和腿部机器人)也必须轻巧才能完成其功能。已经提出了静液压传输,作为满足这两个具有挑战性要求的有前途的策略。在以前的出版物中,结果表明,使用磁性执行器(MR)执行器与静水透射率相结合,可提供高功率密度和出色的开环人类机器人相互作用。尽管如此,传输动力学和非线性摩擦仍会降低低频和高频下的开环力保真度。这封信比较了MR-Hydrstortic执行器系统的控制策略,以增加其扭矩保真度,该扭矩屈服于带宽(测量得出的扭矩参考)和透明度(最小化在机器人背后反射到最终效应器的不需要的力)。开发了四种控制方法并通过实验进行比较:(1)具有摩擦补偿的开环控制; (2)非集中压力反馈; (3)压力反馈; (4)LQGI状态反馈。还实施了抖动策略来平滑球螺钉摩擦。结果表明,方法(1),(2)和(3)可以提高性能,但面临妥协,而方法(4)可以同时改善所有指标。这些结果表明,使用控制方案使用束缚架构来改善机器人的力控制性能的潜力,从而解决了传输动力学和摩擦等问题。
translated by 谷歌翻译